EVENTO
Predição de estruturas de proteínas utilizando restrições de ângulos diedrais
Tipo de evento: Defesa de Dissertação de Mestrado
A predição de estrutura de proteínas é um dos propósitos mais importantes da biologia molecular computacional e possui como objetivo determinar a estrutura tridimensional de proteínas a partir de suas sequências de aminoácidos. Na técnica de predição por primeiros princípios se considera que a sequência de aminoácidos de uma proteína contém toda a informação necessária para que a cadeia adote, em condições fisiológicas, sua conformação tridimensional nativa. Esse tipo de predição se constitui em um problema de otimização extremamente difícil visto que, dependendo das aproximações efetuadas, se lidam com centenas ou milhares de graus de liberdade e com um espaço de busca conformacional muito complexo associado à uma superfície de energia multimodal. Mesmo para uma pequena molécula de proteína, o problema é difícil de ser tratado computacionalmente devido ao alto custo em tempo de execução, além da complexidade associada ao processo de otimização. O objetivo deste trabalho foi o desenvolvimento de operadores genéticos que atuassem no processo de otimização do programa GAPF (Genetic Algorithm for Protein Folding desenvolvido pelo GMSSB/LNCC) através do uso de restrições no espaço de busca de ângulos diedrais associados à cadeia principal da proteína.Esse trabalho se desenvolveu em 4 etapas: I Um banco de estruturas de proteínas determinadas experimentalmente, com até 20% de identidade, foi criado a partir do PDB (Protein Data Bank) e usado para construir uma matriz (matriz RAMA) que associa os ângulos φ e ψ da cadeia principal de cada resíduo de aminoácido, em intervalos de 5º, com as suas respectivas frequências de ocorrência; II - Biblioteca de fragmentos de proteínas para cada uma das sequências estudadas (contendo 9 resíduos de aminoácidos por fragmento e 200 fragmentos para cada posição), foram criadas através do ProFrager (www.lncc.br/sinapad/Profrager/), e informações dos ângulos diedrais dos fragmentos foram obtidas para construir a matriz RAMAfrag, específica para cada proteína; III Dois novos operadores genéticos de mutação, que utilizam as informações das matrizes RAMA e RAMAfrag, foram adaptados ao programa GAPF; e IV A utilização dos operadores foi testada na predição de um conjunto de oito proteínas pertencentes às classes hélice-alfa, alfa+beta e folha-beta. Os resultados obtidos mostraram que a imposição de restrições angulares associadas à utilização dos ângulos φ e ψ mais favoráveis para cada tipo de resíduo, proporcionaram uma redução considerável no número de avaliações de função necessário para se obter um resultado equivalente sem o uso desses operadores. Adicionalmente, foi também possível a obtenção de predições de estruturas mais acuradas. Com a diminuição do tempo de execução do algoritmo se possibilita a realização de experimentos de predição de estruturas para sequências de proteínas mais longas, contornando uma das maiores limitações dos métodos de predição por primeiros princípios.
Data Início: 18/07/2014 Hora: 10:00 Data Fim: 18/07/2014 Hora: 12:00
Local: LNCC - Laboratório Nacional de Computação Ciêntifica - Auditorio A
Aluno: Karina Baptista dos Santos - Laboratório Nacional de Computação Científica - LNCC
Orientador: Fabio Lima Custodio - Laboratório Nacional de Computação Científica - LNCC Laurent Emmanuel Dardenne - Laboratório Nacional de Computação Científica - LNCC
Participante Banca Examinadora: Marisa Fabiana Nicolás - Laboratório Nacional de Computação Científica - LNCC Osmar Norberto de Souza - - PUC RS
Suplente Banca Examinadora: Ernesto Raul Caffarena - PROCC - FIOCRUZ/RJ Helio José Corrêa Barbosa - Laboratório Nacional de Computação Científica - LNCC/MCTI